在上一篇文章中,我們介紹了作者最終挑選模了Elastic net (L1+L2) penalty regularization(彈性網路正規化)作為最後的預測模型,那麼我們現在有了特徵值跟預測模型這麼明確的目標,那麼我們一定要來實測看看究竟運用在運彩上是不是能夠得到優異的結果呢?
數據前處理
1.資料抓取與整理
首先我們必須要先處理好所需的數據,我們先去爬取與計算需要的特徵值,我們的數據期間是以2015年賽季到2021年賽季共7年的比賽,並按照作者篩選掉先發投手平均首發低於12場的比賽
2.特徵重要性
我們也進行了特徵重要性的觀察,發現的確就算我們抓取到最新2021年的數據,「上壘率」仍然是影響比賽勝負中最重要的因子
3.模型準確度
我們以2015年到2020年6年的期間作為模型訓練,而2021年整賽季的數據則做為我們模型最終要實戰的數據,但我們實測的結果在2021年模型的準確度其實只有57.24%,是低於期刊中所顯示的61.77%,這也有可能跟我們訓練的期間長短或是最終驗證的期間差異有關,因為作者是以2016年到2019年4年的數據做出61.77%,可能剛好在2021年的表現只能獲得57.24%,但不論57.24%或是61.77%,我們都必須要能實際運用在運彩投注上才行
沒看過中上篇的人可以去看看唷!!
想要閱讀完整內容可以瀏覽原文
原文出處 : Guess365